2025-01-16 15:46:26.AIbase.
Alibaba Cloud lanza el nuevo modelo de razonamiento matemático Qwen2.5-Math-PRM: la versión de 7B supera a GPT-4o
2025-01-16 10:42:26.AIbase.
El equipo de Qwen de Alibaba lanza un nuevo modelo de recompensa de proceso, haciendo evolucionar el razonamiento matemático
2024-12-15 10:23:35.AIbase.
Alibaba presenta PROCESSBENCH, una nueva prueba de referencia de IA para evaluar la capacidad de identificación de errores en el razonamiento matemático
2024-11-18 07:58:19.AIbase.
Kimi lanza k0-math, un modelo de razonamiento matemático: habilidades matemáticas a la par de la serie o1 de OpenAI
2024-10-14 14:51:30.AIbase.
El equipo de investigación de Apple publica el nuevo benchmark GSM-Symbolic: ¡revela las deficiencias en el razonamiento matemático de los modelos lingüísticos grandes!
2024-07-19 16:36:43.AIbase.